性能影响因素

影响因素

性能在云计算领域属于用户最为关注的重点之一,在IaaS层面,通常基于计算、存储、网络关注以下指标。

  • CPU性能:CPU整体性能指标,包括单线程任务、多线程任务、浮点运算、管道处理、进程创建、系统调用等。
  • 内存性能:内存带宽。
  • 存储性能:存储带宽、存储IOPS、存储延迟。
  • 网络性能:网络带宽、网络包转发率、网络延迟等。
  • IOPS: 磁盘每秒读和写的次数
  • 吞吐量:每秒数据量或操作量。例如,磁盘带宽 网络带宽。
  • 延迟:进行操作的等待时间。例如网络延迟,IO延迟
  • 使用率:在所给定的时间区间内资源的繁忙程度。例如,内存使用率,存储使用率。
  • 瓶颈:在系统性能力,瓶颈指的是限制系统性能的那个资源。
  • 负载:对系统所施加的负载。
  • 缓存:用于复制或者缓冲一定量数据的高速存储区域,用于提高性能。

性能需求预估

性能需求评估一般需要根据业务需求整体评估,以下从CPU、内存、存储、网络等整体评估,任何一个层面存在短板都会导致业务的性能卡顿。

  • CPU:
    • CPU需根据业务的实际需求统计整体需求数量,假定所有业务的CPU数量综合为N个。
    • 生产环境通常CPU超分建议控制在1:4以下,针对CPU敏感性业务CPU超分建议配置为1:1。
    • CPU超分的基准是按照物理CPU的线程数来定义,假定某物理机的CPU总核数为40个,超线程后为80个。
    • 如果按1:3进行CPU超分,则总体可分配的CPU数量为240个。
  • 内存:
    • 内存在生产环境不能配置超分,内存超分使用的是内存同页合并和SWAP,如果使用过多,对业务性能存在重大影响。
    • 内存层面需按照实际需求规划资源,而且考虑到操作系统正常运行及其他关联资源的使用,应提前准备资源的冗余。
    • 例如,云平台的管理节点需要预留16G内存,Ceph存储管理需预留16G资源,Ceph超融合节点每个OSD会消耗两个CPU线程和5G的内存资源。
  • 存储:
    • 存储在生产环境的性能中是至关重要的一环,存储在系统性能层面最慢,但存储的数据最为重要,存储容量需求一般会很高,相关成本也较高。
    • 针对分布式部署的应用结构,可以采用本地存储使用RAID10来配置存储冗余,可以保持较低的成本,也可以提供极低的IO延迟。
    • 针对延迟要求低,IOPS随机读写能力要求高的场景,通常采用FCSAN存储。
    • 针对通用业务,对性能有要求,同时能够实现快速扩展,成本适中的场景,通常采用分布式存储,例如Ceph存储。
    • 存储在生产环境也不建议采用超分,以保障容量使用的有效控制。
    • 存储性能的需求整体需要根据各业务性能需求的累加。
    • 在IOPS层面,依据不同业务的IOPS的混合读写比例总体来控制,在IO带宽层面需要根据各业务的IO带宽需求来整体评估,在IO延迟层面则以最低的延迟要求来评估。
  • 网络:
    • 网络层面在生产环境,通常业务网络配置双万兆,存储网络配置双万兆。
    • 在Ceph场景下,预算充足的场景,可以对存储集群内部网络也配置独立的双万兆网络。
    • 通常情况下,由于预算的考虑,Ceph集群的Public网络和集群内部网络会合并占用两张双万兆网络。
    • 也有部分对IO密集的场景会配置25G或56G网络。

常规性能测试工具及性能损耗

以下简要概述Linux和Windows云主机对其在CPU、内存、存储、网络层面的性能测试工具,及与物理机的性能测试对比。

Linux云主机:

  • CPU性能测试工具:UnixBench,关注浮点运算、字符处理、系统调用等整体性能。
  • 内存性能测试工具:Stream,关注内存带宽性能。

Windows云主机:

  • CPU性能测试工具:CineBench,关注单核和多核CPU性能。
  • 内存性能测试工具:AIDA64,关注内存带宽性能。
  • 存储性能测试工具:fio,关注存储带宽、存储IOPS、存储延迟。对Linux和Windows均适用。
  • 网络性能测试工具:iperf3关注网络带宽性能,ping关注网络延迟性能。对Linux和Windows均适用。

云平台常规的性能对比参考:

  • CPU性能:云主机 VS 物理机:95%~99%。
  • 内存性能:云主机 VS 物理机:89%~93%。
  • 存储性能:存储IO一般是云平台虚拟化的瓶颈,受限于硬件影响较大,不同场景下性能不一,本地存储的性能达物理性能的60%~80%,SAN存储的性能接近物理SAN本身。分布式存储性能需基于硬件情况评估。
  • 网络性能:网络带宽可接近90%~95%,延迟损耗依赖于底层交换机硬件,云主机间延迟一般约0.3ms,物理机间约0.1ms。

results matching ""

    No results matching ""